2019年度(第27回~)


第45回(2020/3/17)

統計学勉強会(担当:澤谷)[資料]

  • ”統計的学習理論入門”
    要旨 学習理論は汎化誤差の解析によりある手法の数理的な本質や正当性・ある尺度における最適性の根拠を示し、性能向上への道標を与える。この点は実験的な事実のみに立脚し再現性の危機を孕むような研究方法と双璧を為す。今回の発表では学習理論に基づく解析の一般的な問題設定と方法論を論じると同時に、実際の手法の解析例を示す。

    Keywords:
    汎化誤差、Bias-Variance分解、集中不等式、supノルム、Glivenko-Cantelliの定理、Rademacher複雑度、Covering number


第44回(2020/2/18)

研究発表(担当:河野)[資料]

  • ”楽曲特徴量を用いた音楽市場分析”
    要旨 TBA


第43回(2020/2/4)

研究発表(担当:五十嵐)[資料]

  • ”Beyond the Bag-of-Words: Customer Review Analysis Using Word Embedding Model Considering Text Topics and Sentiments”
    要旨 Modern e-commerce sites mostly have the function of customer review systems, and it plays a critical role to analyze reviews and understand what customers feel about the products and services. In marketing research, for customer review analysis, researchers often employ topic modeling approach, such as latent Dirichlet allocation. However, for deeply understanding the context in which the words are mentioned, it is important to avoid the bag-of-words assumption, ignoring the order of words in the document, and investigate local co-occurrences with neighbor words as well. Word embedding is one of the approaches capturing the context in which words appear and employed in this research. Moreover, in the proposed model, topics and sentiments of texts are also embedded into the same feature space with word vectors, and they help to improve the interpretability. In empirical analysis, the authors apply the proposed model for customer review data about some cosmetic products and compare the performance with existing models.

    Keywords: Text analysis, Customer review analysis, Word embeddings, Neural network, Topic modeling, Sentiments


第42回(2019/12/17)

論文紹介(担当:原田)[資料]

  • Du,Xu and Willbur (2019) ”Immediate Responses of Online Brand Search and Price Search to TV Ads,” Journal of Marketing, 83(4), 81-100.
    要旨 従来のTV広告の評価は、広告主の直観もしくは消費者態度のサンプル調査によって行われてきた。しかし近年、テレビを見ながらスマートフォンなどのデバイスを利用する「セカンドスクリーン」と呼ばれる行動が一般的になり、テレビ広告もデジタル広告と同じように定量的な指標を用いて評価することができるようになった。本研究では、TV広告放送直後のオンラインの即時的な反応を用いて広告の評価を行うモデルを提案する。


第41回(2019/12/3)

研究発表(担当:五十嵐)[資料]

  • A Model for Social Influence on Topic of Users Contents Generating Behavior
    要旨 ソーシャルメディア上では誰しもが他者の行動に対して何らかの影響を持っており、その影響度に応じて、企業はターゲティング広告などの戦略を取っている。しかし、これまでの研究では、その人が持つ総合的な影響力のみを考慮しており、その人が取る行動や生成するコンテンツの内容は無視されてきた。そこで本研究では、ソーシャルメディア上では、生成するコンテンツの内容によって社会的影響が異なることを仮定し、トピック毎の影響力を推定するための統計モデルを提案する。


第40回(2019/11/17)

統計学勉強会(担当:澤谷)[資料]

  • 統計的推論に対する情報幾何学的アプローチ
    要旨 情報幾何学は近年機械学習や統計学の理論を幾何学的に再構成するとともにそのフロンティアを開拓しており、最適化数学や統計物理に対するアプローチも注目を集めている。この分野はC.R. Rao(1945)以来のFisher情報行列をRiemann計量として多様体上で確率分布空間の幾何学を考える構想にはじまり、甘利俊一氏が双対アファイン接続を提唱したことで一定程度定式化されたと言える。今回はこの考え方に基づき、微分幾何学等の現代数学に極力立ち入ることなく分野の概要及び統計的推論に対する情報幾何のアプローチを紹介する。


第39回(2019/11/12)

研究発表(担当:富田)[資料]

  • LDAを用いたAmazonのレビューデータのデータマイニング
    要旨 企業が自社の商品・サービスの評判を知ることは重要な問題であり、そこから消費者のニーズをつかむことで商品の開発にそれらを反映させられる。近年はAmazonや楽天のようなEC(Electronic Commerce)サイトの普及により電子商取引が増加するとともに、サイト上にカスタマーレビューという形で商品に対する評判が大量に蓄積されており、それらから評判を抽出する手法として自然言語処理のLDAが用いられているが、人間が解釈できる形で評判を抽出することが難しい。本研究では、LDAを拡張したSAGEにtf-idfを用いることで、評判を人間に理解可能な形で抽出することを目指す。


第38回(2019/11/5)

研究発表(担当:酒井)[資料]

  • Recommendation via user’s personality and extracted product feature from text
    要旨 電子商取引の増加により、消費者毎に最適な商品を提案する“レコメンデーション”の重要性が注目されるようになった。マーケティングの分野でよく用いられる推薦手法の一つに「コンテンツベースフィルタリング」がある。これは商品や消費者の特徴量を利用して推薦を行う手法であるが、推薦に有効な特徴量の抽出が課題となっている。本研究では、商品のレビュー文から商品に関する特徴量を抽出し、“Personality”という消費者の特徴量と共にモデリングする。そして商品の“genre”という明示的に与えられる特徴量を用いた場合よりも高い精度で推薦を行うことができることを示すと共に、評価情報が存在しない新規ユーザーに対しても有効に推薦が行えることを示す。


第37回(2019/10/29)

論文紹介(担当:原田)[資料]

  • Leeflang, P. S., & Wittink, D. R. (1992). Diagnosing competitive reactions using (aggregated) scanner data. International Journal of Research in Marketing, 9(1), 39-57." [論文リンク]
  • Krider, R. E., Li, T., Liu, Y., & Weinberg, C. B. (2005). The lead-lag puzzle of demand and distribution: A graphical method applied to movies. Marketing Science, 24(4), 635-645." [論文リンク]
  • 宮崎慧・星野崇宏. (2013). 階層ベイズ動的モデルによるブランドスイッチングの分析: グレンジャー因果性検定の利用. マーケティング・サイエンス, 21(1), 11-35." [論文リンク]
    要旨 経済学分野で広く用いられる、時系列データから因果関係を推測する手法として「グレンジャー因果分析」がある。本発表では、グレンジャー因果の概要と、マーケティング分野での応用を試みた研究を紹介する。


第36回(2019/9/24)

論文紹介(担当:酒井)[資料]

  • Yuanping Ying, Fred Feinberg, and Michel Wedel (2006, JMR) “Leveraging Missing Ratings to Improve Online Recommendation Systems” [論文リンク]
  • Asim Ansari, Skander Essegaier, and Rajeev Kohli (2000, JMR) “Internet Recommendation Systems” [論文リンク]
  • Bruno Jacobs, Bas Donkers, and Dennis Fok (2016, MrkSci) “Model-based Purchase Predictions for Large Assortments” [論文リンク]
    要旨 電子商取引の増加により、消費者毎に最適な商品を提案する“レコメンデーション”の重要性が注目されるようになった。AmazonやYoutubeなど有名なサービスでも用いられた、レコメンデーションの強力な手法の一つに、“協調フィルタリング”がある。消費者の購買を促進するという目的、またその有効性に反して、“協調フィルタリング”に関するマーケティング分野の研究は少ない。その理由の一つとして、協調フィルタリングの結果の解釈性が低いことが考えられる。本発表では、解釈性を保ちながら協調フィルタリングを取り上げたマーケティング分野の研究のいくつかを紹介、その問題点を明らかにした上で、現在構想を練っている提案モデルを紹介する。


第35回(2019/9/10)

論文紹介(担当:澤谷)[資料]

  • M. T. Ribeiro et al. (KDD 2016) “Why Should I Trust You? :Explaining the Predictions of Any Classifier” [論文リンク]
    要旨 深層学習等のブラックボックスモデルの台頭に伴って近年研究が活発である説明可能AI(XAI; Explainable AI)について概観するとともに、その中で特にインパクトのあった論文の提案手法及びその後の展開について紹介する。提案手法は任意のモデルに関してあるデータ点について局所的に解釈可能にするLIME(Local Interpretable Model-agnostic Explanations)及びそれを統合してグローバルな解釈を導くSP(Submodular Pick)-LIMEであり、その理解を目指す。


第34回(2019/8/27)

研究発表(担当:原田)[資料]

  • “多重代入法を用いた回帰分析”
    要旨 欠測データは分析結果の偏りやデータ資源のロスなどの問題を引き起こす。多重代入法は、欠損値を代入したデータセットを複数作成し、その結果を統合することで欠測データの不確実性を考慮しながら欠測データのパラメータ推測を行う手法である。本発表では多重代入法の種々のアルゴリズムとそれらを用いた回帰分析をRで行う方法を紹介する。


第33回(2019/7/16)

研究発表(担当:五十嵐)[資料]

  • “ネットワークとテキストデータに対するトピックモデリング”
    要旨 ソーシャルメディアの発達などにより、消費者同士の交流が購買行動に与える影響は大きくなっており、ネットワークモデルを通して消費者の特性を理解することが企業にとっての重要な課題の一つとなっている。既存のネットワークモデルは、ネットワーク情報のみに着目するものが多いが、ソーシャルメディア上で我々が取る典型的な行動は「ネットワークの形成」だけでなく「コンテンツの生成」である。そこで、本研究ではこれら二つの行動をモデリングすることで、消費者特性の推定を試みる。また、今回の発表では、提案モデルの説明と実証分析にとどまらず、「dynamicsへの拡張」「消費者異質性の考慮」「マーケティングモデルへの応用」という今後の課題についても現時点で考えていることを簡単に紹介する。


第32回(2019/6/25)

論文紹介(担当:北村)[資料]

  • 浅川・岡野(2016)“食品広告の情報的価値が広告に対する注目に及ぼす影響―アイトラッキングによる分析―” [論文リンク]
    要旨 広告効果を高くするためには、消費者に注目してもらう広告表現が重要であるが、同じ広告に接触しても、消費者の商品選択基準によって広告に対する注目度が異なることが考えられる。特に「食」の領域では、消費者の味の嗜好・健康・安全性など、個々人の持っている食品選択基準と広告への注目との関係についての研究が進みつつある。それらの研究ではいずれも、消費者の食品選択基準とパッケージの情報(伝達内容)との間にがあるか否かによって、パッケージ情報への注目度が異なることを明らかにしている。ただし、パッケージのような静止画像から構成されるコンテンツではなく、テレビCMのような動画コンテンツでも同様の結果が得られるか否かについての研究 は行われていない。そこで本研究では、CM でも消費者の食品選択基準と CM の伝達内容との整合性によって、当該 CM の伝達内容への注目度が異なるか否かについてアイトラッキングを用いて検討する。

論文紹介(担当:原田)[資料]

  • Wager & Athey (2018) “Estimation and Inference of Heterogeneous Treatment Effect using Random Forests” [論文リンク]
    要旨 近年、機械学習を用いて因果推論を行う動きが活発化している。今回は、random forestをベースにした手法であるcausal forestについて述べた論文を紹介する。


第30・31回(2019/6/11・18)

機械学習勉強会(担当:美濃)[資料]

  • “Support Vector Machine と Relevance Vector Machine”
    要旨 Support Vector Machine (SVM) とReleveance Vector Machine (RVM) という機械学習の手法は、二値分類問題を中心に非常に優秀な汎化精度を誇る。これらSVMやRVMの持つ様々な特徴について、そのアルゴリズムから考察し、機会学習アルゴリズムの実際に触れる機会を提供する。


第29回(2019/6/4)

論文紹介(担当:長谷川)[資料]

  • Jacob Devlin et al. (2018) “BERT: Pre-training of deep bidirectional transformers for language understanding”
    [論文リンク]
    要旨 近年、目まぐるしい発展を見せている自然言語処理。その中でも昨年10月に発表された汎用言語モデルと期待されているBERTモデルの紹介。オープンソース化もされているBERTモデルの論文を紹介することで、マーケティングの分野でも応用できないかと検討を促すために本論文の概要を簡単に紹介していく。

論文紹介(担当:河野)[資料]

  • 上原 (2018) “音楽情報処理のための楽曲LODの生成・分析基盤の構築”
    要旨 近年の急速なデジタル化の普及を受けて、音楽を対象とした情報処理研究は盛んに行われてきた。しかしその中でも楽曲特徴量はそれぞれ個別に抽出・使用されており、それに関するデータ収集・分析基盤は存在していない。そこで本研究では、楽曲特徴量を扱う研究やアプリケーションの開発に使用できるような楽曲についてのデータ収集・分析基盤の構築をLODの技術を用いることで目指す。


第28回(2019/5/28)

論文紹介(担当:原田)[資料]

  • Rubin and Waterman (2006) “Estimating the Causal Effects of Marketing Interventions Using Propensity Score Methodology”
    [論文リンク]
    要旨 因果関係を評価するためのツールとして傾向スコアが提案されて以来、経済学、疫学、教育学などの無作為実験を実施するのが難しい分野への傾向スコアを用いた解析の例は数多くある。一方で、マーケティング政策(広告、宣伝など)を評価することへの適用はほとんどない。本論文では、製薬会社のセールス派遣についての実例を示しながら傾向スコア法の応用方法を解説している。

統計学勉強会(担当:澤谷)[資料]

  • “空間分析の方法”
    要旨 計量経済学・地球統計学・疫学・犯罪捜査・災害科学など幅広い分野で研究・応用される地理空間情報データ解析の基礎的な手法に関して実例と共に解説し、その全体像の把握を目指す。


第27回(2019/5/21)

研究発表(担当:酒井)

  • “レビューデータを用いたトピックモデルによる利用ホテル・利用場面・評判要因の同時分析”
    要旨 推薦アルゴリズムの一つに、様々な有名サービスで利用されている協調フィルタリングがある。高い精度を誇る協調フィルタリングであるが、推薦理由を付与できないという欠点があり、この改善が望まれている。本研究では、トピックモデルを拡張したモデル「Scene joint topic model(仮)」を提案し、レビューデータに用いることで、協調フィルタリングによる推薦に推薦理由を付与することを試みる。また同時に消費者の、サービス利用場面についての情報をモデルに組み込むことで、利用場面毎の嗜好の違いを明らかにする。

研究発表(担当:横山)[資料]

  • “卒論概要ー女性や高齢者の社会進出が税収に与える効果ー”
    要旨 下敷論文「人口構造の変化に伴う社会保険料給付増加が将来の所得税の課税ベースに与える影響―マイクロ・シミュレーションの手法を用いた将来推計―」を踏まえ、女性や高齢者の労働がどのような経済効果をもたらし、税収に影響を与えるのかを明らかにする。


2018年度(第0回~第26回)


第26回(2019/3/15)

統計学勉強会(担当:富田)[資料]

  • “変分ベイズ推定”
    要旨 統計モデルのパラメータ推定方法である変分ベイズ推定を紹介する。変分ベイズ推定はギブスサンプリングとは対照的に決定論的で近似アルゴリズムであるが、計算コストの低さからLDAでも用いられることがある。今回は、変分ベイズ推定のLDAに対する基本的な適用方法を紹介する。


統計学勉強会(担当:原田)[資料]

  • “多重代入法を用いた欠測データ処理”
    要旨 欠測データは分析結果の偏りやデータ資源のロスなどの問題を引き起こす。これらの問題に対処する方法として、伝統的には平均値代入法や回帰代入法などの単一代入法が用いられてきた。これらの方法は測定に伴う不確実性を考慮していないため、例えば分散などを過小推定してしまうという問題がある。多重代入法は、欠損値を代入したデータセットを複数作成し、その結果を統合することで不確実性を考慮しながら欠測データのパラメータ推測を行う手法である。本発表では多重代入法の概要と多重代入法を用いた回帰分析をRで行う方法を紹介する。


第25回(2019/2/22)

統計学勉強会(担当:五十嵐)[資料]

  • “Metropolis-HastingsアルゴリズムとLDAへの応用”
    要旨 一般に、統計モデルのベイズ推定法として、Metropoli-Hastings (MH) アルゴリズムを用いたMarkov chain Monte Carlo (MCMC) 法がある。これは、完全条件付き事後分布が導出できないモデルであっても、サンプリングが容易な任意の提案分布を使って事後分布を近似することが出来るため、汎用性が高い。これをLDAを始めとするトピックモデルに応用することで、共役な事前分布という制約をなくしたモデル設計が可能となる。本発表では、MHアルゴリズムと単純なLDAに応用した例を紹介する。


第24回(2019/2/8)

機械学習勉強会(担当:五十嵐)[資料]

  • “粒子フィルタとLDAへの応用(理論編)”
    要旨 Latent Dirichlet Allocation (LDA) の一般的な推定法として、周辺化ギブスサンプリングや変分ベイズ、変分EMアルゴリズムなどが良く用いられるが、これらの手法は、全ての文書に対して複数回のサンプリングや最適化を繰り返す必要がある。しかし、メモリに乗らないほどの巨大な文書データや時々刻々と増え続けるデータに対しては、これらの手法では限界がある。一方で、一般的な非線形非正規状態空間モデルの推定法として粒子フィルタ(逐次モンテカルロ法ともいう)と呼ばれる手法が良く用いられる。これをLDAに応用することで、逐次的にデータを学習するオンライン学習が可能になる。本発表ではこの粒子フィルタとそれをLDAに応用させた際のアルゴリズムについて理論的な面から解説を行う。


第23回(2019/1/11)

研究発表(担当:酒井)[補助資料]

  • “Latent Dirichlet Allocation” [論文リンク]
    要旨 トピックに極性を付与したLDAの拡張である、「weakly-supervised Joint Sentiment Topic model」を実装した結果を発表する。原論文では、上記のモデルは文書毎の極性分類に用いられている。そのため抽出したトピックを紹介するとともに、ナイーブベイズ分類器との性能比較も行う。


第22回(2018/12/21)

機械学習勉強会(担当:五十嵐)

  • “Latent Dirichlet Allocation(モデル、崩壊型ギブスサンプリング、実装アルゴリズム)”
    要旨 多くの人が使っているLDAについて、詳細に説明します。パッケージを使う前に分かっていてほしいことを初歩から説明します。是非参加してください。


第21回(2018/12/14)

招待講演(石塚氏 東北大学OB)

  • “Cost-Sensitive MedLDAによるトラウマ患者の転帰予測”
    要旨 集中治療室(ICU)では、集中治療医の判断を補助する手段として、患者の転帰予測に基づく意思決定支援システムが注目されている。近年では、テキストを用いた転帰予測手法が開発されている。テキストを用いた予測手法として教師有りトピックモデル(STM)が知られるが、従来のSTMでは正例と負例の誤判別に等しくペナルティを与えて学習が行われる。患者のICU内死亡率は一般に10%程度であり不均衡データの一例である為、従来のSTMでは死亡例の検知制度が低下する恐れがある。この問題に対処する為、マージン最大化原理、コスト考慮型学習を行う教師有りトピックモデルであるCost-Sensitive MedLDAを提案する。


第20回(2018/12/07)

研究発表(担当:原田)[スライド(一般化傾向スコア)]

  • “一般化傾向スコアの利用法と広告効果測定における実践”
    要旨 因果推論の一手法である傾向スコアと、それを拡張した一般化傾向スコアを用いた解析法について紹介する。 また、一般化傾向スコアを用いて広告の因果効果を推定した私の研究について発表する。


第19回(2018/11/30)

研究発表(担当:酒井)

  • “LDAによるホテルブランドマッピング”


第18回(2018/11/16)

機械学習勉強会(担当:名執)[スライド]

  • “統計的因果探索の基礎とLiNGAMモデルの導入”
    要旨 統計的因果探索の続きです。
    データを用いて因果グラフを推測するためのアプローチとして、「ノンパラメトリックアプローチ」「パラメトリックアプローチ」「セミパラメトリックアプローチ」の3つがありました。このうち、セミパラメトリックアプローチ、特に「LiNGAMアプローチ」に関しては、他の2つのアプローチと違って「因果グラフを一意に推測することが可能」だというところまで話が進んでおります。
    今回の発表では、今までの話の流れを簡単に振り返ると共に、このLiNGAMモデルの紹介(特に、独立成分分析の結果を用いた、LiNGAMモデルの識別可能性の説明)を行いたいと思います。LiNGAMモデルの推定法まで詳しくご紹介できればよいのですが、この部分に関してはまだ私も充分理解できていないので、簡単に触れる程度になってしまうかもしれません。


第17回(2018/11/09)

研究発表(担当:澤谷)[スライド]

  • “ネットワーク分析入門”
    要旨 基本となるグラフ理論からはじめ、全学問領域に関与する「ネットワーク」の魅力を種々の研究とその成果を通じて紹介し、分析の基礎を説明する。また、個人的な応用例として哲学者の影響関係ネットワークの分析過程を紹介する。


第16回(2018/10/26)

研究発表(担当:富田)[スライド][補助資料1][補助資料2]

  • “LDAを用いたAmazonのレビューデータのデータマイニング”
    要旨 研究の進捗を紹介する。トピックモデルをAmazonレビューのデータに用いることによって推定されたトピック分布及び単語分布を示す。また、商品に対する5段階評価のレーティングを従属変数、トピックモデルにより得られた特徴量を独立変数とし、多重回帰分析、多項ロジスティック回帰の結果を示す。


第15回(2018/10/12)

研究発表(担当:酒井)

  • “LDAによる主要ホテルチェーンの特徴抽出”
    要旨 宿泊施設のレビューデータにLDAを用いることで主要なホテルチェーンのトピック割合を比較する。紹介する論文の中では、トピックモデルにより、明確に分かれた評価の次元を抽出しマッピングまで行っているが、それを再現しようとしたところ様々な問題が出てきた。その問題点と、考えている解決策を発表する。
    引用予定の論文:
    Tirunillai, S., & Tellis, G. J. (2014), “Mining marketing meaning from online chatter: Strategic brand analysis of big data using latent dirichlet allocation,” _Journal of Marketing Research_, 51(4), 463-479.


第14回(2018/9/21)

研究発表(担当:富田)[スライド]

  • “LDAを用いたAmazonのレビューデータのデータマイニング”
    要旨 以前の発表ではトピックモデルを用いた商品の評判要因分析に関する検討(月岡 et al.)の紹介と今後の私の研究の方針を紹介した。今回は実際にAmazonのレビューデータに対してLDAを用いてトピックの数やトピック上位の単語を推定した結果を示すとともに、そこから得られた特徴量(トピック分布や単語の出現確率)に対してどのような推定手法を使うか等を説明する


第13回(2018/9/14)

研究発表(担当:五十嵐)[スライド]

  • “トピックモデルによるネットワーク分析”
    要旨 ネットワークデータのためのトピックモデルであるMixed Membership Stochastic Blockmodelsを用いることで、Binary-Networkからトピック毎のTopic-Networkを推定し、そのネットワーク上のインフルエンサーが商品の普及に与える影響を分析する。


第11・12回(2018/8/10, 2018/8/24)

R言語勉強会

  • R練習問題 [PDF][R code example]
    おすすめサイト
    • [R-Tips]
      Rユーザー必見のサイト 躓いたらまずここに来ると良い
    • [Cookbook for R]
      同じくRの入門者用サイトとして非常に良くまとまっている
      特にGraphsのページを読めば基本的なggplotの使い方が身に付く
    • [stack overflow]
      世界的に人気のあるプログラミング質問サイト
      正しいキーワードで検索できればほとんどの疑問が解決する(日本語のサイトもある)
    • [Qiita]
      エンジニアリングに関する日本語のブログ記事が豊富にある
      細かいが使えるTipsが多い
    • [RjpWiki]
      R版のWikipedia 非常に多様な情報が掲載されている


第10回(2018/8/3)

ポスター発表(担当:五十嵐)[論文] [ポスター]

  • Mirai Igarashi, Nobuhiko Terui (2018) “A Topic Model Using Text Information on Social Media for Social Network Analysis” 
    要旨 From some online social medias such as Twitter and Facebook, we can obtain not only network information represents the relationships between users but also text information as user-generated-contents. In modern society that users are related to each other and their attitude towards companies change, it is one of the important marketing interests to capture the characteristics of social network by modeling this two information appropriately for many applications such as seeding strategy. In marketing fields, various models have been proposed to solve such issue, but in this research, we propose a novel approach us ing text information on social media.
    Keywords:
    social network analysis, topic modeling, seeding strategy


第9回(2018/7/13)

論文紹介(担当:富田)[資料]

  • 宮井、西尾 (2014) “飲食サービスを利用したおもてなし消費構造の分析” [論文リンク]
    要旨 スパース・モデリングという技術が様々な分野で応用されている。この手法は今あるデータのサイズが小さくても精度の良いデータ予測をしたり、今あるデータからかけている部分のデータを予測したり、応用範囲は様々ある。今回の発表ではスパース・モデリングとは何かというイントロダクションと、スパース・モデリングが用いられている論文の紹介を行う。


第8回(2018/7/6)

機械学習勉強会(担当:名執・五十嵐)[資料]

  • “統計的因果探索の出発点(続き)”
  • “統計的因果探索の基礎” 
    要旨 社会科学、こと経済学においては、回帰分析モデルが代表するように現象の因果構造を既知として、あるいは過去の文献等から因果構造を仮定して様々な議論が行われている。しかし、現実の世界では、現象の因果構造が分からず、過去の文献等も十分でない状況が存在することは想像に難くない。統計的因果探索はこのような状況においても因果構造を推定し、その後の議論に貢献するという点で大きな力を発揮する。
    本発表では、『統計的因果探索』(清水2017)をベースにして統計的因果探索の基礎を説明する。ランダム化実験が可能な状況においては因果構造推定は容易であるが、現実にはランダム化実験が不可能あるいは望ましくない状況が多数存在する。このような状況においても出来る限り因果構造を推定するための手法として、「ノンパラメトリックアプローチ」「パラメトリックアプローチ」「セミパラメトリックアプローチ」の3種類を紹介し、それぞれがどのような推定を行うかを議論する。是非勉強会に参加し、経済学部では学ばない統計手法とその考え方を体感していただきたい。


第7回(2018/6/29)

機械学習勉強会(担当:名執)[資料]

  • “統計的因果探索の出発点”
    要旨 データから「因果関係」を推測するための機械学習技術である「統計的因果探索」について、その考え方の基礎となる部分をご紹介いたし ます(『機械学習プロフェッショナルシリーズ 統計的因果探索』の内容がベース)。
    • 擬似相関
    • 統計的因果推論
    • 平均因果効果、ランダム化実験 など


第6回(2018/6/22)

機械学習勉強会(担当:藤島)[資料]

  • “ニューラルネットワーク”
    要旨 現在の深層学習の様々なモデルの下地となっているニューラルネットの基礎をご紹介させていただきます。
    • 神経細胞のネットワーク
    • 順伝播型ニューラルネット
    • 急降下法による学習


第5回(2018/6/8)

研究紹介(担当:五十嵐)

  • 澤田(2018) “音楽イベントの券売予測モデルの構築―状態空間モデルとニューラルネットワークモデル(LSTM等)との比較―” [リンク]
    要旨 推定されたパラメータを解釈することによりマーケティングにおける議論が可能な状態空間モデル、解釈は出来ないが予測の精度に優れるニューラルネットワーク自己回帰モデル(NNARX)及びリカレントニューラルネットワーク(LSTM-RNN)で音楽イベントのチケット売上を予測する研究。
  • 中山(2018) “重点顧客セグメントの識別とアンサンブルアルゴリズムによる特徴量の抽出” [リンク]
    要旨 機械学習という応用的・解釈の難しいモデルをしようしながらも、データ分析の初心者でも扱いやすく精度を高めやすいという汎用性と、分析結果の解釈によりアクションプランの創出につなげるというデータの可読性を重視したアルゴリズムを提案した研究。


第4回(2018/6/1)

研究発表(担当:五十嵐)[スライド]

  • “ソーシャルメディア上のテキスト情報を考慮したインフルエンサー検出モデル”
    要旨 近年、ソーシャルメディアの発達に呼応して、人々の口コミを通じて情報の拡散を狙うバイラル・マーケティングという手法が注目を集めている。そのため、ソーシャルネットワーク上で強い影響力をもった人々(インフルエンサーと呼ばれる)を見つけ出すことはマーケティングにおいて重要な課題である。インフルエンサーの検出を目指す先行研究では、ネットワーク関係をモデル化し、ネットワーク上でバイラル・マーケティングに有用な位置を占めている人物をインフルエンサーとして定める一方で、ユーザーがどのような関心を持っているかは無視している。そこで本研究では、ソーシャルメディアから得られるデータとして、ユーザーの関心が表れる投稿情報とユーザー同士の関係性を表すリンク情報を同時に分析するモデルを提案する。この提案モデルにより、ユーザーの関心に沿った情報の拡散を狙う新たなバイラル・マーケティングが可能となる。
    Twitterデータを用いた分析では、ユーザー同士のリンクごと、及びユーザーが持つ関心ごとに影響力を推定し、シミュレーション実験では、影響力が大きいほどインフルエンサーに相応しい人物であるとする仮定の下、バイラル・マーケティングと実データにおける情報拡散の速度を比較した。結果として、提案モデルを用いたバイラル・マーケティングの方が実データよりも情報をすばやくかつ多くのユーザーに拡散することが出来るとする示唆を得た。


第3回(2018/5/25)

論文紹介(担当:酒井)[資料]

  • Ganu et al. (2009) “Beyond the Stars: Improving Rating Predictions using Review Text Content” [論文リンク]
    要旨 インターネット上での口コミは年々その量を増すばかりです。データ量が増え、ビッグデータと言っても過言ではなくなった今こそ、テキストデータから何か知見が得られるのではないでしょうか。この度ご紹介するのは、レストランの評価サイトのテキストデータを、レコメンデーション(推薦)の精度の向上に活用した論文です。一昔前のものになってしまいますが、テキストデータをレコメンデーションに活用する先駆けとなった研究だそうです。身近なデータがどのように活用されるのか、興味がある方は是非参加をお願いします。


第2回(2018/5/18)

論文紹介(担当:富田)[資料][スライド]

  • 月岡ら(2015) “トピックモデルを用いた商品の評判要因分析に関する検討” [論文リンク]
    要旨
    1. 研究テーマ
      機械学習の手法を用いたECサイトのレビューデータのデータマイニング
    2. 研究背景
      消費者に対してアンケートを取り、そこで得られる情報から商品やサービスを改善するというのは以前から行われていた。アンケート調査は対象者への負担が少ないが項目を絞る必要があり、自由記述は対象者に負担をかけるが事前に想定していなかった情報が得られる。また、アンケート・自由記述共に人的費用と実行費用が大きい。これに対してネット上のレビューデータは費用を抑えつつ大量にデータが得られ、かつ自由記述なのでこれを活用することで自社のサービスや製品のユーザビリティを高められる。
    3. 研究目的
      機械学習の知見をマーケティングサイエンスに適用して、消費者への理解をより深める。
    4. 研究の対象と方法-トピックモデル
      テキストデータをそのまま活用することは難しいが、テキストを形態素解析し単語の頻度分布を推定する。トピック(そこでどのような内容が話されているか)及び、単語がどのように分布しているかを分析するトピックモデルを用いれば、そのハードルを越えられる。紹介する論文は楽天のサイト上で得られたホテルに対するレビューにトピックモデルを用いて、そこのトピック分布を推定し、それらを説明変数、サービスに対する評点を被説明変数として重回帰分析を行い、ホテルのサービスに対する評価にどの要因が影響を与えているかを定量的に分析する手法を検討したものである。
    5. 論文・参考文献
      [1] 月岡、吉川、古橋:トピックモデルを用いた商品の評判要因分析に関する検討、2015
      [2] 岩田具治:トピックモデル、講談社、2015


第1回(2018/5/11)

論文紹介(担当:宮川)[資料]

  • 大竹ら (2017) “EC サイトにおけるソーシャルログイン会員のサイト内行動分析―ゴルフ用品 EC サイトを対象とした会員の特徴と購買行動分析―” [論文リンク]
    要旨 SNS利用者数は目下年々増加しています。これを背景として、ソーシャルメディアを利用した広告・マーケティング活動が注目を集めておりますが、その一環として「ソーシャルログイン」が挙げられます。ソーシャルログインとはアカウント連携機能の一種で、ソーシャルメディア上のIDを用いて、他のサイトにログインすることを指す用語です。今回私が参加者の皆様にご紹介するのは、ソーシャルログインを利用している会員のサイト内行動が、その他の一般会員のそれとどのように異なっているかを分析した論文です。決定木分析を利用しているので、それなりに興味深く、理解しやすい結果が出ています。卒論や研究の参考になると思いますので是非ご参加ください。


第0回(2018/4/20)

論文紹介デモンストレーション(担当:五十嵐)[資料][スライド]

  • Chae et al. (2017) “Spillover Effects in Seeded Word-of-Mouth Marketing Campaigns” [論文リンク]
    要旨 自己紹介、第1回以降の内容・日時の決定、論文紹介のデモンストレーションなど
    勉強会の開催を伝える際に、Marketing Science, Journal of Marketing Research などのトップジャーナルの論文を紹介して皆で議論すると伝えましたが、どのようなイメージかを掴んでいただくために、第0回では五十嵐が担当します。↓の論文を紹介したいと思います。興味がある方は事前に読んでみてください(図書館やICTルームなどの学内回線であれば無料で見れるはずです)。もちろん読んでいなくともその場にいるだけで分かるような説明を心がけます。ご安心ください。
    Chae, I., Stephen, A.T., Bart, Y., and Yao, D. (2017) “Spillover Effects in Seeded Word-of-Mouth Marketing Campaigns,” Marketing Scie nce, 36(1), 89-104.


Copyright © 2020 Mirai Igarashi All rights reserved.